OcrV1, Main, Exploration, bibRecord, 001A01

A recognition algorithm for chinese characters in diverse fonts

Identifieur interne : 001A01 ( Main/Exploration ); précédent : 001A00; suivant : 001A02

A recognition algorithm for chinese characters in diverse fonts

Auteurs : XIANLI WU [République populaire de Chine] ; MIN WU [États-Unis]

Source :

Proceedings - International Conference on Image Processing [ 1522-4880 ] ; 2002.

RBID : Pascal:04-0074302

Descripteurs français

Pascal (Inist)
- Algorithme, Chinois, Dictionnaire, Mesure de distance, Discriminateur, Reconnaissance optique caractère, Reconnaissance caractère, Reconnaissance forme, Extraction caractéristique, Traitement signal.
Wicri :
- topic : Dictionnaire.

English descriptors

KwdEn :
- Algorithm, Character recognition, Chinese, Dictionaries, Discriminator, Distance measurement, Feature extraction, Optical character recognition, Pattern recognition, Signal processing.

Abstract

This paper proposes an algorithm for recognizing Chinese characters in many diverse fonts including Song, Fang, Kai, Hei, Yuan, Lishu, Weibei, and Xingkai. The algorithm is based on features derived from Peripheral Direction Contributivity and utilizes a set of dictionaries. A 3-level matching is first performed with respect to each dictionary. The distance measures associated with these matchings are then fed into a central discriminator to output the final recognition result. We propose a new multi-dictionary matching algorithm for use in the central discriminator that utilizes estimated information of neighborhood fonts. Experiments have been performed on a practical OCR software system whose recognition kernel is based on the proposed algorithm. Fast and accurate recognition has been accomplished both in title recognition involving all of the 8 fonts and in main-body recognition that usually involves the first 4 most commonly used fonts.

Affiliations:

Links toward previous steps (curation, corpus...)

to stream PascalFrancis, to step Corpus: 000572
to stream PascalFrancis, to step Curation: 000218
to stream PascalFrancis, to step Checkpoint: 000639
to stream Main, to step Merge: 001A92
to stream Main, to step Curation: 001A01

Le document en format XML

<record><TEI><teiHeader><fileDesc><titleStmt><title xml:lang="en" level="a">A recognition algorithm for chinese characters in diverse fonts</title>
<author><name sortKey="Xianli Wu" sort="Xianli Wu" uniqKey="Xianli Wu" last="Xianli Wu">XIANLI WU</name>
<affiliation wicri:level="1"><inist:fA14 i1="01"><s1>Engineering Center of Character Recognition, Institute of Automation, Chinese Academy of Sciences</s1>
<s2>Beijing 100080</s2>
<s3>CHN</s3>
<sZ>1 aut.</sZ>
</inist:fA14>
<country>République populaire de Chine</country>
<placeName><settlement type="city">Pékin</settlement>
</placeName>
</affiliation>
</author>
<author><name sortKey="Min Wu" sort="Min Wu" uniqKey="Min Wu" last="Min Wu">MIN WU</name>
<affiliation wicri:level="4"><inist:fA14 i1="02"><s1>Department of Electrical and Computer Engineering, University of Maryland</s1>
<s2>College Park, MD 20742</s2>
<s3>USA</s3>
<sZ>2 aut.</sZ>
</inist:fA14>
<country>États-Unis</country>
<placeName><region type="state">Maryland</region>
<settlement type="city">College Park (Maryland)</settlement>
</placeName>
<orgName type="university">Université du Maryland</orgName>
</affiliation>
</author>
</titleStmt>
<publicationStmt><idno type="wicri:source">INIST</idno>
<idno type="inist">04-0074302</idno>
<date when="2002">2002</date>
<idno type="stanalyst">PASCAL 04-0074302 INIST</idno>
<idno type="RBID">Pascal:04-0074302</idno>
<idno type="wicri:Area/PascalFrancis/Corpus">000572</idno>
<idno type="wicri:Area/PascalFrancis/Curation">000218</idno>
<idno type="wicri:Area/PascalFrancis/Checkpoint">000639</idno>
<idno type="wicri:doubleKey">1522-4880:2002:Xianli Wu:a:recognition:algorithm</idno>
<idno type="wicri:Area/Main/Merge">001A92</idno>
<idno type="wicri:Area/Main/Curation">001A01</idno>
<idno type="wicri:Area/Main/Exploration">001A01</idno>
</publicationStmt>
<sourceDesc><biblStruct><analytic><title xml:lang="en" level="a">A recognition algorithm for chinese characters in diverse fonts</title>
<author><name sortKey="Xianli Wu" sort="Xianli Wu" uniqKey="Xianli Wu" last="Xianli Wu">XIANLI WU</name>
<affiliation wicri:level="1"><inist:fA14 i1="01"><s1>Engineering Center of Character Recognition, Institute of Automation, Chinese Academy of Sciences</s1>
<s2>Beijing 100080</s2>
<s3>CHN</s3>
<sZ>1 aut.</sZ>
</inist:fA14>
<country>République populaire de Chine</country>
<placeName><settlement type="city">Pékin</settlement>
</placeName>
</affiliation>
</author>
<author><name sortKey="Min Wu" sort="Min Wu" uniqKey="Min Wu" last="Min Wu">MIN WU</name>
<affiliation wicri:level="4"><inist:fA14 i1="02"><s1>Department of Electrical and Computer Engineering, University of Maryland</s1>
<s2>College Park, MD 20742</s2>
<s3>USA</s3>
<sZ>2 aut.</sZ>
</inist:fA14>
<country>États-Unis</country>
<placeName><region type="state">Maryland</region>
<settlement type="city">College Park (Maryland)</settlement>
</placeName>
<orgName type="university">Université du Maryland</orgName>
</affiliation>
</author>
</analytic>
<series><title level="j" type="main">Proceedings - International Conference on Image Processing</title>
<idno type="ISSN">1522-4880</idno>
<imprint><date when="2002">2002</date>
</imprint>
</series>
</biblStruct>
</sourceDesc>
<seriesStmt><title level="j" type="main">Proceedings - International Conference on Image Processing</title>
<idno type="ISSN">1522-4880</idno>
</seriesStmt>
</fileDesc>
<profileDesc><textClass><keywords scheme="KwdEn" xml:lang="en"><term>Algorithm</term>
<term>Character recognition</term>
<term>Chinese</term>
<term>Dictionaries</term>
<term>Discriminator</term>
<term>Distance measurement</term>
<term>Feature extraction</term>
<term>Optical character recognition</term>
<term>Pattern recognition</term>
<term>Signal processing</term>
</keywords>
<keywords scheme="Pascal" xml:lang="fr"><term>Algorithme</term>
<term>Chinois</term>
<term>Dictionnaire</term>
<term>Mesure de distance</term>
<term>Discriminateur</term>
<term>Reconnaissance optique caractère</term>
<term>Reconnaissance caractère</term>
<term>Reconnaissance forme</term>
<term>Extraction caractéristique</term>
<term>Traitement signal</term>
</keywords>
<keywords scheme="Wicri" type="topic" xml:lang="fr"><term>Dictionnaire</term>
</keywords>
</textClass>
</profileDesc>
</teiHeader>
<front><div type="abstract" xml:lang="en">This paper proposes an algorithm for recognizing Chinese characters in many diverse fonts including Song, Fang, Kai, Hei, Yuan, Lishu, Weibei, and Xingkai. The algorithm is based on features derived from Peripheral Direction Contributivity and utilizes a set of dictionaries. A 3-level matching is first performed with respect to each dictionary. The distance measures associated with these matchings are then fed into a central discriminator to output the final recognition result. We propose a new multi-dictionary matching algorithm for use in the central discriminator that utilizes estimated information of neighborhood fonts. Experiments have been performed on a practical OCR software system whose recognition kernel is based on the proposed algorithm. Fast and accurate recognition has been accomplished both in title recognition involving all of the 8 fonts and in main-body recognition that usually involves the first 4 most commonly used fonts.</div>
</front>
</TEI>
<affiliations><list><country><li>République populaire de Chine</li>
<li>États-Unis</li>
</country>
<region><li>Maryland</li>
</region>
<settlement><li>College Park (Maryland)</li>
<li>Pékin</li>
</settlement>
<orgName><li>Université du Maryland</li>
</orgName>
</list>
<tree><country name="République populaire de Chine"><noRegion><name sortKey="Xianli Wu" sort="Xianli Wu" uniqKey="Xianli Wu" last="Xianli Wu">XIANLI WU</name>
</noRegion>
</country>
<country name="États-Unis"><region name="Maryland"><name sortKey="Min Wu" sort="Min Wu" uniqKey="Min Wu" last="Min Wu">MIN WU</name>
</region>
</country>
</tree>
</affiliations>
</record>

Pour manipuler ce document sous Unix (Dilib)

EXPLOR_STEP=$WICRI_ROOT/Ticri/CIDE/explor/OcrV1/Data/Main/Exploration

HfdSelect -h $EXPLOR_STEP/biblio.hfd -nk 001A01 | SxmlIndent | more

HfdSelect -h $EXPLOR_AREA/Data/Main/Exploration/biblio.hfd -nk 001A01 | SxmlIndent | more

Pour mettre un lien sur cette page dans le réseau Wicri

{{Explor lien
   |wiki=    Ticri/CIDE
   |area=    OcrV1
   |flux=    Main
   |étape=   Exploration
   |type=    RBID
   |clé=     Pascal:04-0074302
   |texte=   A recognition algorithm for chinese characters in diverse fonts
}}

This area was generated with Dilib version V0.6.32.
Data generation: Sat Nov 11 16:53:45 2017. Site generation: Mon Mar 11 23:15:16 2024

	Serveur d'exploration sur l'OCR
	Attention, ce site est en cours de développement ! Attention, site généré par des moyens informatiques à partir de corpus bruts. Les informations ne sont donc pas validées.

Serveur d'exploration sur l'OCR

A recognition algorithm for chinese characters in diverse fonts

A recognition algorithm for chinese characters in diverse fonts

Source :

Descripteurs français

English descriptors

Abstract

Links toward previous steps (curation, corpus...)

Le document en format XML

Pour manipuler ce document sous Unix (Dilib)

Pour mettre un lien sur cette page dans le réseau Wicri